李宇明:中国的语言资源理念 | 人民政协报
本文原载于《人民政协报》2019-01-14期10版
中国有100多种语言,汉语文献有数千年积累,是世界上语言资源十分丰富的国度。中国在历史上也比较重视对语言资源的保护、开发和利用,有许多经验值得总结和继承。但是,真正理性认识到语言的资源意义,特别是把语言资源作为国家语言规划的重要理念,并在国家层面、全国范围采取语言资源保护行动,还是这十几年来的事情。语言作为社会资源近些年来得到社会的认可和重视。
由自然资源到社会资源
人类的资源观是不断发展的,其发展也反映着人类社会的进步。资源是人类生产、生活所凭借的资料,某种资料能否成为社会认可的资源,取决于两个条件:第一,资源的“有用性”。科学技术的发展可以将过去不能使用的资料用于生产和生活,将不能这样或那样使用的资料这样地或那样地用于生产和生活。比如电和石油,古已有之,但是人类的科学技术发展到可以把电、石油作为能源的时代,电和石油才成为人类的资源。第二,资源“有用性”的被认识。有些资料本来是生产、生活不可或缺的,但是由于某种原因人们没有认识到或忽视了它的资源性质。例如当雾霾不严重时,人们认识不到清新空气的资源性质;当污染不严重时,人们认识不到清洁水的资源性质。最易被社会感知到的资源是稀缺资源,“稀缺性”几乎成为资源的一种附加属性。
资源有自然资源和社会资源两大类。在人类的资源意识中,首先被认识的是自然资源,然后是社会资源。《现代汉语词典》是反映“公民常识”的词典,从第一版到第六版,对“资源”词条的解释一直强调是生产资料和生活资料的“天然来源”,所举的例子共涉及“地下资源”“水力资源”“人力资源”“旅游资源”等4种。2016年的第七版对“资源”的解释有了较大发展:“生产资料或生活资料的来源,包括自然资源和社会资源。”不再强调资源的“天然性”,明确把资源分为自然资源和社会资源,举例中增加了“信息资源”。
《辞海》是一部带有百科性质的工具书,第一版到第四版都把“资源”解释为“资财的来源。一般指天然的财源”。其对“资源”的认识比同时的《现代汉语词典》还狭窄。到了1999年的第五版,《辞海》为“资源”增加了一个新义项:“一国或一定地区内拥有的物力、财力、人力等物质要素的总称。分为自然资源和社会资源两大类。前者如阳光、空气、水、土地、森林、草原、动物、矿藏等;后者包括人力资源、信息资源以及劳动创造的物质财富。”这个认识是比较到位的,它不仅不再强调资源的“天然性”,不仅把资源分为自然资源和社会资源,而且认为社会资源包括“劳动创造的物质财富”。其实更进一步看,社会资源还应包括“劳动创造的精神财富”。
语言资源、种类及语言保护
《现代汉语词典》和《辞海》在举例中都没有提及“语言资源”。事实上人类对语言资源的认识的确是比较晚的事情。国外在20世纪下半叶才陆续有“语言资源”的提法,但他们所谓的语言资源主要指的是语言教学可资应用的语言资料,或一些语种及语种人才是国家可资利用的资源。我国最早使用语言资源概念是在20世纪80年代,指的也是语言教学资源。到21世纪初,语言资源的使用频率逐渐提高,而且意义也多是指的一般语言,不再局限于语言教学。
语言资源的理念首先在学术领域发展起来,之后进入国家的语言规划实践。截至2018年10月,知网中以“语言资源”为关键词的文献有450余篇,涉及作者300余人。论文发表数量在2004年出现一个小高峰,2008年出现第二个高峰,2011年、2016年又出现两个大高峰。这些高峰的出现都与国家的语言规划事件相关联。如2004年前后国家语委开始建立“国家语言资源监测中心”,逐渐形成了“平面媒体、有声媒体、网络媒体、民族语言、教育教材、海外华语”等分中心。2008年前后,国家语委开始推进“中国语言资源有声语言数据库”建设。2011年前后,有声语言数据库推进顺利,涉及的省份扩大,并开始酝酿“语言资源保护工程”。2015年,教育部、国家语委印发了《关于启动中国语言资源保护工程的通知》。预计今后语言资源的学术研究将出现新的高峰,因为2018年9月,中国政府与联合国教科文组织在长沙联合召开了首届“世界语言资源保护大会”,会议主题是“语言多样性对于构建人类命运共同体的作用”,会议还向世界发表了《岳麓宣言》。学术与实践的相互推动使语言资源理念不仅在中国发挥了重要作用,而且也开始影响世界。
我国早期的语言资源研究,主要是论证语言具有资源的性质,确立语言资源的合理性。之后研究主要集中在语言资源的分类及如何开展语言资源保护工作。语言资源有广义和狭义之分,广义的语言资源应该包括三类:口头语言资源;书面语言资源;语言知识、语言技术、语言艺术、语言人才等语言衍生资源。
狭义的语言资源仅指濒危的语言资源,基本上都是口头语言。狭义的语言资源认识主要用于支持语言保护,特别是濒危语言保护。语言保护当然也是当今全球的热点话题,据专家预测,本世纪末90%的语言将濒危甚至消亡。若从交际的角度看,这些语言濒危或消亡也许并不是严重问题,但是若从文化的角度看,却是文化的灾难,因为每种语言都记载着某民族(部族)的历史、经验及世界观,而这些精神财富绝大多数还没有被现代人类社会所了解,没有成为现代人类知识的一部分。语言保护就是与时间赛跑,抢救失而不可复得的人类精神资财。我国的百余种语言以及大量的汉语方言也有许多处在濒危状态或是出现濒危的态势,语言保护的任务也是急迫而沉重的。
仔细分析起来,语言保护有三个层次:第一是“语言保存”,即通过书面记录和录音录像方式,将语言(包括方言)记录下来,并建立起数据库、博物馆保存这些“语言标本”。当前学者进行的多是语言保存层面的工作。第二是“语言卫护”,通过各种措施来延长语言的生命,维护语言的活力,这类工作保护的是“语言活态”。由于语言活态保护必然会对语言使用者的生存、生活方式及生存、生活环境进行不同程度的干预,伦理学上的要求很高,工作的难度很大。国内外在语言卫护上都做了一些探索,积累了一些经验,但总体上看成效并不明显,前景并不清晰。第三是语言资源的开发利用,即对语言保存、语言卫护的成果进一步开发,获取语言保护的社会“红利”。“红利”意识十分重要,它可激发语言保护的动力,及时发挥语言保护的效力,不断增加语言保护的实力,保证语言保护事业可持续发展。
语言资源的功能视角
资源的基本属性是其“有用性”,全面认识语言资源、充分利用语言资源,都需要认识其功能。语言资源的功能是随着社会的发展进步而逐渐被认识的。在我们的文化传统中,文字和书面语比口语更受重视,但是在近来以语言保护为首要任务的语言资源研究与实践中,口语的语言资源意义得到了较多关注,而书面语的语言资源意义则反而受关注较少,研究较少。同时,语言知识、语言技术、语言艺术、语言人才等衍生性的语言资源,才刚刚出现在某些语言资源研究者的论述中。全面认识语言资源,科学评价语言资源工作,包括语言资源的收集整理、标注入库、分析研究、开发应用等,都需要明确的语言资源功能意识。
语言资源功能理念下的“语言”,并不只是个“符号系统”,更是个“知识系统”。比如语言保护,不应只是记录、保护语言符号,而是记录、保护人类的语言知识体系。语言学家传统的语言调查,目的主要是揭示语言的符号系统,而在揭示语言的知识系统方面明显不足。从“语言知识观”的立场出发,词汇、语法、语用、篇章最为重要,人类的知识和思维运作主要贮存在、表现在词汇、语法、语用和篇章之中。由此来看,语言保护工作必须在语言调查方法、调查内容等方面进行大幅度改进。
社会正在向“智能时代”迈进,人工智能是智能时代的最主要的技术力量。人工智能的核心是语言智能,机器获取语言智能主要靠语言大数据的训练。语言大数据也是语言资源,从语言智能的视角来看语言资源,语言资源就进入了生产资料的范畴,对人类的意义就更加不一般了。
无论从文化视角还是从人工智能视角,对语言资源的认识、特别是对语言资源功能的认识都需要加强。语言资源的保护与集聚需要人类社会的合作,包括不同地区、不同国家、不同国际组织的合作,不同社会部门和不同学科的合作。为了保证这种合作的顺利开展,需要制定一系列国际标准,包括技术标准、工作标准和社会伦理标准。语言资源关涉到人类的知识库存、精神家园和生产资料的集聚管理,必须加强学术研究,加大加快社会行动。
(作者系北京语言大学教授、语言资源高精尖创新中心首席专家)
往期回顾:
1.李宇明:所见所闻皆学问一言一语总关情—序《英国语言生活见闻录》
2.李宇明:写在水头浪尖处—序《中国语言政策研究报告(2018)》
6.听说贾宝玉的住所又叫“Happy Red Court”?|《语言规划学研究》
7.藏文产生及发展——字母、读音、拼写、编码、信息化(干货!)| 讲座回顾
想法丨发现丨习惯丨人文
让阅读成为习惯,让灵魂拥有温度
陪伴是最长情的告白
每日为你推送语言风向标
识别二维码
关注我们
即刻点击原文,发现世界的美好